查看原文
其他

Homie快来听,AI的嘻哈也很酷 | DeeCamp Show

创新工场 2021-09-05

Homie快来听,AI编的hiphop,耳朵听了会怀孕:


https://v.qq.com/txp/iframe/player.html?vid=h07698mla0s&width=500&height=375&auto=0

从去年的中国有嘻哈到今年的中国新说唱,一股“嘻哈热”席卷了每个街头。这个诞生于美国贫民区街头的文化形式正受到越来越多人的喜爱。


不同于其他音乐形式,嘻哈有着一套专属的节奏、押韵要求。


无韵不成诗,嘻哈作为当代的“地下诗”,入门门槛并不低。毕竟评价一个Rapper是否优秀的重要标尺可是“才华”。


可谁说创作是人类的专属才能?


AI的Freestyle水平可丝毫不逊色于人类哦。


在创新工场人工智能工程院NLP算法工程师王德瑞的指导下,DeeCamp的第6组成员在基于图灵测试理念的评估方法之上,将AI算法与嘻哈歌词的内在规律进行了有机整合,最终打造了一个既有吸引力,也能彰显AI未来价值的出色项目:AWLyrics--AI有嘻哈。


据说在AWLyrics中,2分钟内就能创作出一首嘻哈歌曲的歌词。


那么,AI写嘻哈歌词的水平如何?真的能达到以假乱真、赶超人类的地步吗?


一、AWLyrics vs 人类





别慌,我们先来猜猜看,下面的歌词哪些是AI写的:


不是乐理专修 做点儿曲式研究 我们的力量来自宇宙 自己的节奏

不是乐理专修 所有听的观众 打破他们传统 进到环球 继续让你感受


再来一个:


自己就带上了有色眼镜 金钱摧毁多少事情 瓦解你的中枢神经

自己就带上了有色眼镜 我只想把世界分的更清 却发现自己却模糊了心


正确答案是:第一行都是模型生成的,第二行是原作


你答对了吗?有没有被惊艳到,可以看出,AI的作词水平还是很稳的,“押韵”不在话下。


而据第6组的组内测试结果显示,能猜对的正确率不超过 30%,就连李开复博士都被这个“未满月”的AI蒙骗了。


二、搭建AI模型


1、数据


第6组一共使用了 10 w 条嘻哈歌词,并且已经将一些不符合社会主义核心价值观的句子标注了出来。数据的预处理主要步骤如下:


  • 在对句子进行筛选之后,利用 Jieba 进行分词,观察到单句长度集中在 8~10 左右;

  • 在利用 Tensorflow 中的 Tokenizer 进行 tokenize 并构建 word2idex 字典后,词表大小在 11000 左右;

  • 利用 pad_sequence 将句子 padding 到 20;

  • 构建 x-y pair,利用上一句预测下一句,分割数据集。


    2、模型


    第6组的生成模型的整体基于 SeqGAN,,并在此基础上做出了改进:增加输入语句的编码,并将原先生成器的损失函数改成Penalty-based Objective。模型架构如下:


    


    三、两分钟诞生一首嘻哈歌词


    在AWLyrics中,使用者首先要选择一个主题,任意输入歌曲的起始句,就能马上创作出一首嘻哈歌词,如果个人对主题、意境不太满意,还可进行更换,两分钟内就能找到一首有主题、有内涵的歌曲。

     

    


    比如,输入“人和机器的关系”,就可能出现这样一首歌词,“人和机器的关系,我答应自己灵魂不会贬值,逐渐袭来的睡意,跟着朋友继续骑……”。 


    据该小组的成员李磊介绍,“人工智能在语料拼接上,有时搭配出来的效果很不一样,别有内涵与韵味,很有可能会比人类来得好。” 


    有了AWLyrics,创作者再也不怕灵感枯竭,每个人都可以随心随性的来段freestyle了~


    四、比AWLyrics更嘻哈的宝藏组合


    可能很多人都有这样的刻板印象:技术厉害的人在生活中一定很无趣。毕竟上帝都为他们打开了IQ的大门,总要关上一点EQ的小窗。


    难道,能做出这么厉害的AI成品,并在高手云集的DeeCamp中杀出重围,荣获“最佳Demo奖“的第6组,是群无聊的技术宅?

    

    但据知情人士透露:DeeCamp的第6组成员可比AWLyrics更有趣,是当之无愧的宝藏组合了!


    


    在DeeCamp中,每个小组都会被分配一位中传的设计大神为其制作demo演示,大家都很期待到来的是一位漂亮的小姐姐,最后却事与愿违都分到了男生。而由于团队中的女生年龄全部大于男生年龄,因此6组的男生们又被称“弟弟天团”。


    在刚开始制作AWLyrics的时候,无论输入什么,AI写出的句子都是“变成液态“,深感无奈又被逗笑的成员们一度想自称为“液态”组。


    而后期在测试基本完成的AWLyrics时,成员们将吴亦凡的freestyle作为测试语料,在他们输入吴亦凡的原作“这个面它又宽又长,就像这个碗它又大又圆”后,AWLyrics生成了“这个面它又宽又长/如果hiphop是一杯烈酒麻烦给我满上/竭尽全力让内心的空荡/所有遗落的时光我用时间补偿”这样的作品。


    


    有趣的第6组将科研的压力都转化为动力,将生活中的小插曲都凝练为创意。


    他们有爱,在得知学校附近奶茶店店主的孩子生病之后,便隔三差五都会一起点奶茶支持。


    他们重情,在拿到了DeeCamp2018最佳Demo奖后,因为整个团队只有一个奖杯。成员们决定仿照破镜重圆的故事,将奖杯分成8份碎片,每个人都悉心保存。等日后再带着碎片来京城寻找能把奖杯碎片拼起来的人。


    他们有梦,“坚信未来的十年,是属于人工智能的,是属于愿意投身于这波浪潮中的我们的”。


    嘻哈音乐中的每一个rapper都个性分明,不羁和傲气都写在脸上。


    AI是没有感情的,可创造AI的人类是生动的。


    在这群有梦敢追的AI新人的心中:Freestyle只是个小目标,未来是不是也可以运用增强学习,让人工智能像AlphaGo一样在battle赛场上打败人类对手呢?


    推荐阅读:

    欢迎关注创新工场微信公众号:chuangxin2009。创新工场拥有强大的投资和投后团队,持续输出关于创业投资、投后的真知灼见~ 还有机会参与到创业培训、沙龙和其他各类活动中。



    : . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存